Integrating Information Entropy and Latent Dirichlet Allocation Models for Analysis of Safety Accidents in the Construction Industry

نویسندگان

چکیده

Construction accident investigation reports contain critical information, but extracting useful insights from the voluminous Chinese text is challenging. Traditional methods rely on expert judgment, which leads to time-consuming and potentially inaccurate results. To overcome this problem, we propose a novel approach that combines mining techniques latent Dirichlet allocation (LDA) models analyze standardized in construction industry. The proposed method integrates an information entropy term frequency-inverse document frequency (TF-IDF) weighting scheme evaluate importance accounts for word model uncertainty. was applied set of industry identify key factors leading safety accidents. results show causal accidents consist keywords negative expressions, including “failure timely hazards” “inadequate site management”. Failure hazards most common factor reports, expressions commonly used include “not timely” place”. TF-IDF superior traditional terms accuracy efficiency, LDA considers feature weights better able capture underlying themes corpus. And subject make up more about causes This helps managers quickly effectively understand messages lead incident reports. It gives insight into patterns associated with incidents, such as unsafe practices, hazardous work environments, non-compliance regulations. enables them informed decisions improve management practices.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

the application of multivariate probit models for conditional claim-types (the case study of iranian car insurance industry)

هدف اصلی نرخ گذاری بیمه ای تعیین نرخ عادلانه و منطقی از دیدگاه بیمه گر و بیمه گذار است. تعین نرخ یکی از مهم ترین مسایلی است که شرکتهای بیمه با آن روبرو هستند، زیرا تعیین نرخ اصلی ترین عامل در رقابت بین شرکتها است. برای تعیین حق بیمه ابتدا می باید مقدار مورد انتظار ادعای خسارت برای هر قرارداد بیمه را برآورد کرد. روش عمومی مدل سازی خسارتهای عملیاتی در نظر گرفتن تواتر و شدت خسارتها می باشد. اگر شر...

15 صفحه اول

the analysis of the role of the speech acts theory in translating and dubbing hollywood films

از محوری ترین اثراتی که یک فیلم سینمایی ایجاد می کند دیالوگ هایی است که هنرپیش گان فیلم میگویند. به زعم یک فیلم ساز, یک شیوه متأثر نمودن مخاطب از اثر منظوره نیروی گفتارهای گوینده, مثل نیروی عاطفی, ترس آور, غم انگیز, هیجان انگیز و غیره, است. این مطالعه به بررسی این مسأله مبادرت کرده است که آیا نیروی فراگفتاری هنرپیش گان به مثابه ی اعمال گفتاری در پنج فیلم هالیوودی در نسخه های دوبله شده باز تولید...

15 صفحه اول

the stady and analysis of rice agroclimatology in lenjan

the west of esfahan province, iran, is one of the most important agricultural areas throughout the country due to the climate variability and life-giving water of zayanderood river. rice is one of the major and economic crops in this area. the most important climatic elements in agricultural activities which should be considered include temperature, relative humidity, precipitation and wind. so...

15 صفحه اول

Latent Dirichlet Markov Allocation for Sentiment Analysis

In recent years probabilistic topic models have gained tremendous attention in data mining and natural language processing research areas. In the field of information retrieval for text mining, a variety of probabilistic topic models have been used to analyse content of documents. A topic model is a generative model for documents, it specifies a probabilistic procedure by which documents can be...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: Buildings

سال: 2023

ISSN: ['2075-5309']

DOI: https://doi.org/10.3390/buildings13071831